
<!DOCTYPE HTML>
<html lang="zh-hans" >
    <head>
        <meta charset="UTF-8">
        <meta content="text/html; charset=utf-8" http-equiv="Content-Type">
        <title>第 8 章 Spark 数据倾斜解决方案 · 大数据 bigdata_spark_kernel-optimize_atguigu 课堂笔记</title>
        <meta http-equiv="X-UA-Compatible" content="IE=edge" />
        <meta name="description" content="">
        <meta name="generator" content="GitBook 3.2.3">
        <meta name="author" content=" 李振超">
        
        
    
    <link rel="stylesheet" href="../gitbook/style.css">

    
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-splitter/splitter.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-expandable-chapters-small/expandable-chapters-small.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-page-toc-button/plugin.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-prism/prism-solarizedlight.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-tbfed-pagefooter/footer.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-change_girls/girls.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-search/search.css">
                
            
                
                <link rel="stylesheet" href="../gitbook/gitbook-plugin-fontsettings/website.css">
                
            
        

    

    
        
        <link rel="stylesheet" href="../styles/website.css">
        
    
        
    
        
    
        
    
        
    

        
    
    
    <meta name="HandheldFriendly" content="true"/>
    <meta name="viewport" content="width=device-width, initial-scale=1, user-scalable=no">
    <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">
    <link rel="apple-touch-icon-precomposed" sizes="152x152" href="../gitbook/images/apple-touch-icon-precomposed-152.png">
    <link rel="shortcut icon" href="../gitbook/images/favicon.ico" type="image/x-icon">

    
    <link rel="next" href="di-9-zhang-spark-troubleshooting.html" />
    
    
    <link rel="prev" href="di-7-zhang-spark-xing-neng-you-hua/74-jvm-diao-you.html" />
    

    </head>
    <body>
        
<div class="book">
    <div class="book-summary">
        
            
<div id="book-search-input" role="search">
    <input type="text" placeholder="输入并搜索" />
</div>

            
                <nav role="navigation">
                


<ul class="summary">
    
    
    
        
        <li>
            <a href="http://www.atguigu.com/" target="_blank" class="custom-link">联系我们</a>
        </li>
    
    

    
    <li class="divider"></li>
    

    
        
        <li class="header">第 1 部分: Spark 内核</li>
        
        
    
        <li class="chapter " data-level="1.1" data-path="../">
            
                <a href="../">
            
                    
                    第 1 章 Spark 内核概述
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.1.1" data-path="../11-spark-he-xin-zu-jian-hui-gu.html">
            
                <a href="../11-spark-he-xin-zu-jian-hui-gu.html">
            
                    
                    1.1 Spark 核心组件回顾
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.1.2" data-path="../12-spark-tong-yong-yun-xing-liu-cheng-gai-shu.html">
            
                <a href="../12-spark-tong-yong-yun-xing-liu-cheng-gai-shu.html">
            
                    
                    1.2 Spark 通用运行流程概述
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.2" data-path="../chapter1.html">
            
                <a href="../chapter1.html">
            
                    
                    第 2 章 Spark 通讯架构
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.2.1" data-path="../chapter1/21-spark-tong-xun-jia-gou-gai-shu.html">
            
                <a href="../chapter1/21-spark-tong-xun-jia-gou-gai-shu.html">
            
                    
                    2.1 Spark 通讯架构概述
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.2.2" data-path="../chapter1/23-spark-tong-xin-jia-gou-jie-xi.html">
            
                <a href="../chapter1/23-spark-tong-xin-jia-gou-jie-xi.html">
            
                    
                    2.2 Spark 通信架构解析
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.2.3" data-path="../chapter1/22-spark-qi-dong-liu-cheng-fen-xi.html">
            
                <a href="../chapter1/22-spark-qi-dong-liu-cheng-fen-xi.html">
            
                    
                    2.3 Spark 启动流程分析
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.2.3.1" data-path="../chapter1/22-spark-qi-dong-liu-cheng-fen-xi/231-master-liu-cheng-fen-xi.html">
            
                <a href="../chapter1/22-spark-qi-dong-liu-cheng-fen-xi/231-master-liu-cheng-fen-xi.html">
            
                    
                    2.3.1 Master 启动源码分析
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.2.3.2" data-path="../chapter1/22-spark-qi-dong-liu-cheng-fen-xi/232-worker-liu-cheng-fen-xi.html">
            
                <a href="../chapter1/22-spark-qi-dong-liu-cheng-fen-xi/232-worker-liu-cheng-fen-xi.html">
            
                    
                    2.3.2 Worker 启动源码分析
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.3" data-path="../di-3-zhang-spark-bu-shu-mo-shi.html">
            
                <a href="../di-3-zhang-spark-bu-shu-mo-shi.html">
            
                    
                    第 3 章 Spark 部署模式
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.3.1" data-path="../di-3-zhang-spark-bu-shu-mo-shi/31-yarn-mo-shi-yun-xing-ji-zhi.html">
            
                <a href="../di-3-zhang-spark-bu-shu-mo-shi/31-yarn-mo-shi-yun-xing-ji-zhi.html">
            
                    
                    3.1 Yarn 模式运行机制
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.3.1.1" data-path="../di-3-zhang-spark-bu-shu-mo-shi/31-yarn-mo-shi-yun-xing-ji-zhi/yarn-mo-shi-yun-xing-ji-zhi-yuan-ma-fen-xi.html">
            
                <a href="../di-3-zhang-spark-bu-shu-mo-shi/31-yarn-mo-shi-yun-xing-ji-zhi/yarn-mo-shi-yun-xing-ji-zhi-yuan-ma-fen-xi.html">
            
                    
                    1. Yarn cluster 模式运行机制源码分析
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.3.1.2" data-path="../di-3-zhang-spark-bu-shu-mo-shi/31-yarn-mo-shi-yun-xing-ji-zhi/yarn-client-mo-shi-yun-xing-ji-zhi-yuan-ma-fen-xi.html">
            
                <a href="../di-3-zhang-spark-bu-shu-mo-shi/31-yarn-mo-shi-yun-xing-ji-zhi/yarn-client-mo-shi-yun-xing-ji-zhi-yuan-ma-fen-xi.html">
            
                    
                    2. Yarn client 模式运行机制源码分析
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.3.2" data-path="../di-3-zhang-spark-bu-shu-mo-shi/32-standalone-mo-shi-yun-xing-ji-zhi.html">
            
                <a href="../di-3-zhang-spark-bu-shu-mo-shi/32-standalone-mo-shi-yun-xing-ji-zhi.html">
            
                    
                    3.2 Standalone 模式运行机制
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.4" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi.html">
            
                    
                    第 4 章 Spark 任务调度机制
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.4.1" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/41-spark-ren-wu-diao-du-gai-shu.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/41-spark-ren-wu-diao-du-gai-shu.html">
            
                    
                    4.1 Spark 任务调度概述
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.4.2" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/42-spark-stage-ji-bie-diao-du.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/42-spark-stage-ji-bie-diao-du.html">
            
                    
                    4.2 Spark Stage 级别调度
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.4.3" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du.html">
            
                    
                    4.3 Spark Task 级别调度
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.4.3.1" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du/431-diao-du-ce-lve.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du/431-diao-du-ce-lve.html">
            
                    
                    4.3.1 调度策略
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.4.3.2" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du/432-ben-di-hua-diao-du.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du/432-ben-di-hua-diao-du.html">
            
                    
                    4.3.2 本地化调度
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.4.3.3" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du/433-shi-bai-zhong-shi-he-hei-ming-dan.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/43-spark-task-ji-bie-diao-du/433-shi-bai-zhong-shi-he-hei-ming-dan.html">
            
                    
                    4.3.3 失败重试和黑名单
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.4.4" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/44-ren-wu-diao-du-yuan-ma-fen-xi.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/44-ren-wu-diao-du-yuan-ma-fen-xi.html">
            
                    
                    4.4 Stage 级别任务调度源码分析
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.4.5" data-path="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/45-task-ji-bie-ren-wu-diao-du-yuan-ma-fen-xi.html">
            
                <a href="../di-4-zhang-spark-ren-wu-diao-du-ji-zhi/45-task-ji-bie-ren-wu-diao-du-yuan-ma-fen-xi.html">
            
                    
                    4.5 Task 级别任务调度源码分析
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.5" data-path="../di-5-zhang-spark-shuffle-jie-xi.html">
            
                <a href="../di-5-zhang-spark-shuffle-jie-xi.html">
            
                    
                    第 5 章 Spark Shuffle 解析
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.5.1" data-path="../di-5-zhang-spark-shuffle-jie-xi/51-shuffle-de-he-xin-yao-dian.html">
            
                <a href="../di-5-zhang-spark-shuffle-jie-xi/51-shuffle-de-he-xin-yao-dian.html">
            
                    
                    5.1 Shuffle 的核心要点
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.5.2" data-path="../di-5-zhang-spark-shuffle-jie-xi/52-hashshuffle-jie-xi.html">
            
                <a href="../di-5-zhang-spark-shuffle-jie-xi/52-hashshuffle-jie-xi.html">
            
                    
                    5.2 HashShuffle 解析
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.5.3" data-path="../di-5-zhang-spark-shuffle-jie-xi/53-sortshuffle-jie-xi.html">
            
                <a href="../di-5-zhang-spark-shuffle-jie-xi/53-sortshuffle-jie-xi.html">
            
                    
                    5.3 SortShuffle 解析
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.5.3.1" data-path="../di-5-zhang-spark-shuffle-jie-xi/53-sortshuffle-jie-xi/sortshuffle-yuan-ma-jie-xi.html">
            
                <a href="../di-5-zhang-spark-shuffle-jie-xi/53-sortshuffle-jie-xi/sortshuffle-yuan-ma-jie-xi.html">
            
                    
                    SortShuffle 源码解析
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter " data-level="1.6" data-path="../di-6-zhang-spark-nei-cun-jie-xi.html">
            
                <a href="../di-6-zhang-spark-nei-cun-jie-xi.html">
            
                    
                    第 6 章 Spark 内存管理
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="1.6.1" data-path="../61-dui-nei-he-dui-wai-nei-cun-gui-hua.html">
            
                <a href="../61-dui-nei-he-dui-wai-nei-cun-gui-hua.html">
            
                    
                    6.1 堆内核堆外内存规划
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.6.2" data-path="../62-nei-cun-kong-jian-fen-pei.html">
            
                <a href="../62-nei-cun-kong-jian-fen-pei.html">
            
                    
                    6.2 内存空间分配
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.6.3" data-path="../63-cun-chu-nei-cun-guan-li.html">
            
                <a href="../63-cun-chu-nei-cun-guan-li.html">
            
                    
                    6.3 存储内存管理
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="1.6.4" data-path="../64-zhi-xing-nei-cun-guan-li.html">
            
                <a href="../64-zhi-xing-nei-cun-guan-li.html">
            
                    
                    6.4 执行内存管理
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    

    
        
        <li class="header">第 2 部分: Spark 性能优化和故障处理</li>
        
        
    
        <li class="chapter " data-level="2.1" data-path="di-7-zhang-spark-xing-neng-you-hua.html">
            
                <a href="di-7-zhang-spark-xing-neng-you-hua.html">
            
                    
                    第 7 章 Spark 性能优化
            
                </a>
            

            
            <ul class="articles">
                
    
        <li class="chapter " data-level="2.1.1" data-path="di-7-zhang-spark-xing-neng-you-hua/71-chang-gui-xing-neng-diao-you.html">
            
                <a href="di-7-zhang-spark-xing-neng-you-hua/71-chang-gui-xing-neng-diao-you.html">
            
                    
                    7.1 常规性能调优
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="2.1.2" data-path="di-7-zhang-spark-xing-neng-you-hua/72-suan-zi-diao-you.html">
            
                <a href="di-7-zhang-spark-xing-neng-you-hua/72-suan-zi-diao-you.html">
            
                    
                    7.2 算子调优
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="2.1.3" data-path="di-7-zhang-spark-xing-neng-you-hua/73-shuffle-diao-you.html">
            
                <a href="di-7-zhang-spark-xing-neng-you-hua/73-shuffle-diao-you.html">
            
                    
                    7.3 Shuffle 调优
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="2.1.4" data-path="di-7-zhang-spark-xing-neng-you-hua/74-jvm-diao-you.html">
            
                <a href="di-7-zhang-spark-xing-neng-you-hua/74-jvm-diao-you.html">
            
                    
                    7.4 JVM 调优
            
                </a>
            

            
        </li>
    

            </ul>
            
        </li>
    
        <li class="chapter active" data-level="2.2" data-path="di-8-zhang-spark-shu-ju-qing-xie.html">
            
                <a href="di-8-zhang-spark-shu-ju-qing-xie.html">
            
                    
                    第 8 章 Spark 数据倾斜解决方案
            
                </a>
            

            
        </li>
    
        <li class="chapter " data-level="2.3" data-path="di-9-zhang-spark-troubleshooting.html">
            
                <a href="di-9-zhang-spark-troubleshooting.html">
            
                    
                    第 9 章 Spark Troubleshooting
            
                </a>
            

            
        </li>
    

    

    <li class="divider"></li>

    <li>
        <a href="https://www.gitbook.com" target="blank" class="gitbook-link">
            本书使用 GitBook 发布
        </a>
    </li>
</ul>


                </nav>
            
        
    </div>

    <div class="book-body">
        
            <div class="body-inner">
                
                    

<div class="book-header" role="navigation">
    

    <!-- Title -->
    <h1>
        <i class="fa fa-circle-o-notch fa-spin"></i>
        <a href=".." >第 8 章 Spark 数据倾斜解决方案</a>
    </h1>
</div>




                    <div class="page-wrapper" tabindex="-1" role="main">
                        <div class="page-inner">
                            
<div id="book-search-results">
    <div class="search-noresults">
    
                                <section class="normal markdown-section">
                                
                                <h1 id="&#x7B2C;-8-&#x7AE0;-spark-&#x6570;&#x636E;&#x503E;&#x659C;&#x89E3;&#x51B3;&#x65B9;&#x6848;">&#x7B2C; 8 &#x7AE0; Spark &#x6570;&#x636E;&#x503E;&#x659C;&#x89E3;&#x51B3;&#x65B9;&#x6848;</h1>
<p>Spark &#x4E2D;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x4E3B;&#x8981;&#x6307;<code>shuffle</code>&#x8FC7;&#x7A0B;&#x4E2D;&#x51FA;&#x73B0;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#xFF0C;&#x662F;&#x7531;&#x4E8E;&#x4E0D;&#x540C;&#x7684;<code>key</code>&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#x91CF;&#x4E0D;&#x540C;&#x5BFC;&#x81F4;&#x7684;&#x4E0D;&#x540C;<code>task</code>&#x6240;&#x5904;&#x7406;&#x7684;&#x6570;&#x636E;&#x91CF;&#x4E0D;&#x540C;&#x7684;&#x95EE;&#x9898;&#x3002;</p>
<p>&#x4F8B;&#x5982;&#xFF0C;<code>reduce</code>&#x70B9;&#x4E00;&#x5171;&#x8981;&#x5904;&#x7406;<code>100</code>&#x4E07;&#x6761;&#x6570;&#x636E;&#xFF0C;&#x7B2C;&#x4E00;&#x4E2A;&#x548C;&#x7B2C;&#x4E8C;&#x4E2A;<code>task</code>&#x5206;&#x522B;&#x88AB;&#x5206;&#x914D;&#x5230;&#x4E86;<code>1&#x4E07;</code>&#x6761;&#x6570;&#x636E;&#xFF0C;&#x8BA1;&#x7B97;<code>5&#x5206;&#x949F;</code>&#x5185;&#x5B8C;&#x6210;&#xFF0C;&#x7B2C;&#x4E09;&#x4E2A;<code>task</code>&#x5206;&#x914D;&#x5230;&#x4E86;<code>98&#x4E07;</code>&#x6570;&#x636E;&#xFF0C;&#x6B64;&#x65F6;&#x7B2C;&#x4E09;&#x4E2A;<code>task</code>&#x53EF;&#x80FD;&#x9700;&#x8981;<code>10&#x4E2A;&#x5C0F;&#x65F6;</code>&#x5B8C;&#x6210;&#xFF0C;&#x8FD9;&#x4F7F;&#x5F97;&#x6574;&#x4E2A;Spark&#x4F5C;&#x4E1A;&#x9700;&#x8981;<code>10&#x4E2A;&#x5C0F;&#x65F6;</code>&#x624D;&#x80FD;&#x8FD0;&#x884C;&#x5B8C;&#x6210;&#xFF0C;&#x8FD9;&#x5C31;&#x662F;&#x6570;&#x636E;&#x503E;&#x659C;&#x6240;&#x5E26;&#x6765;&#x7684;&#x540E;&#x679C;&#x3002;</p>
<p>&#x6CE8;&#x610F;&#xFF0C;&#x8981;&#x533A;&#x5206;&#x5F00;&#x6570;&#x636E;&#x503E;&#x659C;&#x4E0E;&#x6570;&#x636E;&#x91CF;&#x8FC7;&#x91CF;&#x8FD9;&#x4E24;&#x79CD;&#x60C5;&#x51B5;&#xFF0C;<my>&#x6570;&#x636E;&#x503E;&#x659C;&#x662F;&#x6307;&#x5C11;&#x6570;<code>task</code>&#x88AB;&#x5206;&#x914D;&#x4E86;&#x7EDD;&#x5927;&#x591A;&#x6570;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x56E0;&#x6B64;&#x5C11;&#x6570;<code>task</code>&#x8FD0;&#x884C;&#x7F13;&#x6162;&#xFF1B;&#x6570;&#x636E;&#x8FC7;&#x91CF;&#x662F;&#x6307;&#x6240;&#x6709;<code>task</code>&#x88AB;&#x5206;&#x914D;&#x7684;&#x6570;&#x636E;&#x91CF;&#x90FD;&#x5F88;&#x5927;&#xFF0C;&#x76F8;&#x5DEE;&#x4E0D;&#x591A;&#xFF0C;&#x6240;&#x6709;<code>task</code>&#x90FD;&#x8FD0;&#x884C;&#x7F13;&#x6162;&#x3002;</my></p>
<blockquote>
<p>&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x8868;&#x73B0;&#xFF1A;</p>
</blockquote>
<ol>
<li><p><code>Spark</code> &#x4F5C;&#x4E1A;&#x7684;&#x5927;&#x90E8;&#x5206; <code>task</code> &#x90FD;&#x6267;&#x884C;&#x8FC5;&#x901F;&#xFF0C;&#x53EA;&#x6709;&#x6709;&#x9650;&#x7684;&#x51E0;&#x4E2A;<code>task</code>&#x6267;&#x884C;&#x7684;&#x975E;&#x5E38;&#x6162;&#xFF0C;&#x6B64;&#x65F6;&#x53EF;&#x80FD;&#x51FA;&#x73B0;&#x4E86;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x4F5C;&#x4E1A;&#x53EF;&#x4EE5;&#x8FD0;&#x884C;&#xFF0C;&#x4F46;&#x662F;&#x8FD0;&#x884C;&#x5F97;&#x975E;&#x5E38;&#x6162;&#xFF1B;</p>
</li>
<li><p>Spark &#x4F5C;&#x4E1A;&#x7684;&#x5927;&#x90E8;&#x5206;task&#x90FD;&#x6267;&#x884C;&#x8FC5;&#x901F;&#xFF0C;&#x4F46;&#x662F;&#x6709;&#x7684;task&#x5728;&#x8FD0;&#x884C;&#x8FC7;&#x7A0B;&#x4E2D;&#x4F1A;&#x7A81;&#x7136;&#x62A5;&#x51FA;OOM&#xFF0C;&#x53CD;&#x590D;&#x6267;&#x884C;&#x51E0;&#x6B21;&#x90FD;&#x5728;&#x67D0;&#x4E00;&#x4E2A;task&#x62A5;&#x51FA;OOM&#x9519;&#x8BEF;&#xFF0C;&#x6B64;&#x65F6;&#x53EF;&#x80FD;&#x51FA;&#x73B0;&#x4E86;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x4F5C;&#x4E1A;&#x65E0;&#x6CD5;&#x6B63;&#x5E38;&#x8FD0;&#x884C;&#x3002;</p>
</li>
</ol>
<blockquote>
<p>&#x5B9A;&#x4F4D;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#xFF1A;</p>
</blockquote>
<ol>
<li><p>&#x67E5;&#x9605;&#x4EE3;&#x7801;&#x4E2D;&#x7684;<code>shuffle</code>&#x7B97;&#x5B50;&#xFF0C;&#x4F8B;&#x5982;<code>reduceByKey</code>&#x3001;<code>countByKey</code>&#x3001;<code>groupByKey</code>&#x3001;<code>join</code>&#x7B49;&#x7B97;&#x5B50;&#xFF0C;&#x6839;&#x636E;&#x4EE3;&#x7801;&#x903B;&#x8F91;&#x5224;&#x65AD;&#x6B64;&#x5904;&#x662F;&#x5426;&#x4F1A;&#x51FA;&#x73B0;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF1B;</p>
</li>
<li><p>&#x67E5;&#x770B; Spark &#x4F5C;&#x4E1A;&#x7684; log &#x6587;&#x4EF6;&#xFF0C;log &#x6587;&#x4EF6;&#x5BF9;&#x4E8E;&#x9519;&#x8BEF;&#x7684;&#x8BB0;&#x5F55;&#x4F1A;&#x7CBE;&#x786E;&#x5230;&#x4EE3;&#x7801;&#x7684;&#x67D0;&#x4E00;&#x884C;&#xFF0C;&#x53EF;&#x4EE5;&#x6839;&#x636E;&#x5F02;&#x5E38;&#x5B9A;&#x4F4D;&#x5230;&#x7684;&#x4EE3;&#x7801;&#x4F4D;&#x7F6E;&#x6765;&#x660E;&#x786E;&#x9519;&#x8BEF;&#x53D1;&#x751F;&#x5728;&#x7B2C;&#x51E0;&#x4E2A;stage&#xFF0C;&#x5BF9;&#x5E94;&#x7684; shuffle &#x7B97;&#x5B50;&#x662F;&#x54EA;&#x4E00;&#x4E2A;&#xFF1B;</p>
</li>
</ol>
<hr>
<h2 id="81-&#x805A;&#x5408;&#x539F;&#x6570;&#x636E;">8.1 &#x805A;&#x5408;&#x539F;&#x6570;&#x636E;</h2>
<h3 id="1-&#x907F;&#x514D;shuffle&#x8FC7;&#x7A0B;">1. &#x907F;&#x514D;<code>shuffle</code>&#x8FC7;&#x7A0B;</h3>
<p>&#x7EDD;&#x5927;&#x591A;&#x6570;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;Spark &#x4F5C;&#x4E1A;&#x7684;&#x6570;&#x636E;&#x6765;&#x6E90;&#x90FD;&#x662F; Hive &#x8868;&#xFF0C;&#x8FD9;&#x4E9B; Hive &#x8868;&#x57FA;&#x672C;&#x90FD;&#x662F;&#x7ECF;&#x8FC7; ETL &#x4E4B;&#x540E;&#x7684;&#x6628;&#x5929;&#x7684;&#x6570;&#x636E;&#x3002;
&#x4E3A;&#x4E86;&#x907F;&#x514D;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x6211;&#x4EEC;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x907F;&#x514D; shuffle &#x8FC7;&#x7A0B;&#xFF0C;&#x5982;&#x679C;&#x907F;&#x514D;&#x4E86;shuffle&#x8FC7;&#x7A0B;&#xFF0C;&#x90A3;&#x4E48;&#x4ECE;&#x6839;&#x672C;&#x4E0A;&#x5C31;&#x6D88;&#x9664;&#x4E86;&#x53D1;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x7684;&#x53EF;&#x80FD;&#x3002;</p>
<p>&#x5982;&#x679C;Spark&#x4F5C;&#x4E1A;&#x7684;&#x6570;&#x636E;&#x6765;&#x6E90;&#x4E8E;Hive&#x8868;&#xFF0C;&#x90A3;&#x4E48;&#x53EF;&#x4EE5;&#x5148;&#x5728; Hive &#x8868;&#x4E2D;&#x5BF9;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x805A;&#x5408;&#xFF0C;&#x4F8B;&#x5982;&#x6309;&#x7167; <code>key</code> &#x8FDB;&#x884C;&#x5206;&#x7EC4;&#xFF0C;&#x5C06;&#x540C;&#x4E00;<code>key</code> &#x5BF9;&#x5E94;&#x7684;&#x6240;&#x6709;<code>value</code>&#x7528;&#x4E00;&#x79CD;&#x7279;&#x6B8A;&#x7684;&#x683C;&#x5F0F;&#x62FC;&#x63A5;&#x5230;&#x4E00;&#x4E2A;&#x5B57;&#x7B26;&#x4E32;&#x91CC;&#x53BB;&#xFF0C;&#x8FD9;&#x6837;&#xFF0C;&#x4E00;&#x4E2A;<code>key</code>&#x5C31;&#x53EA;&#x6709;&#x4E00;&#x6761;&#x6570;&#x636E;&#x4E86;&#xFF1B;&#x4E4B;&#x540E;&#xFF0C;&#x5BF9;&#x4E00;&#x4E2A;<code>key</code>&#x7684;&#x6240;&#x6709;<code>value</code>&#x8FDB;&#x884C;&#x5904;&#x7406;&#x65F6;&#xFF0C;&#x53EA;&#x9700;&#x8981;&#x8FDB;&#x884C;<code>map</code>&#x64CD;&#x4F5C;&#x5373;&#x53EF;&#xFF0C;&#x65E0;&#x9700;&#x518D;&#x8FDB;&#x884C;&#x4EFB;&#x4F55;&#x7684;<code>shuffle</code>&#x64CD;&#x4F5C;&#x3002;&#x901A;&#x8FC7;&#x4E0A;&#x8FF0;&#x65B9;&#x5F0F;&#x5C31;&#x907F;&#x514D;&#x4E86;&#x6267;&#x884C;<code>shuffle</code>&#x64CD;&#x4F5C;&#xFF0C;&#x4E5F;&#x5C31;&#x4E0D;&#x53EF;&#x80FD;&#x4F1A;&#x53D1;&#x751F;&#x4EFB;&#x4F55;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x3002;</p>
<p>&#x5BF9;&#x4E8E;Hive&#x8868;&#x4E2D;&#x6570;&#x636E;&#x7684;&#x64CD;&#x4F5C;&#xFF0C;&#x4E0D;&#x4E00;&#x5B9A;&#x662F;&#x62FC;&#x63A5;&#x6210;&#x4E00;&#x4E2A;&#x5B57;&#x7B26;&#x4E32;&#xFF0C;&#x4E5F;&#x53EF;&#x4EE5;&#x662F;&#x76F4;&#x63A5;&#x5BF9;key&#x7684;&#x6BCF;&#x4E00;&#x6761;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x7D2F;&#x8BA1;&#x8BA1;&#x7B97;&#x3002;</p>
<my>&#x8981;&#x533A;&#x5206;&#x5F00;&#xFF0C;&#x5904;&#x7406;&#x7684;&#x6570;&#x636E;&#x91CF;&#x5927;&#x548C;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x533A;&#x522B;</my>

<h3 id="2-&#x7F29;&#x5C0F;key&#x7C92;&#x5EA6;&#xFF08;&#x589E;&#x5927;&#x6570;&#x636E;&#x503E;&#x659C;&#x53EF;&#x80FD;&#x6027;&#xFF0C;&#x964D;&#x4F4E;&#x6BCF;&#x4E2A;task&#x7684;&#x6570;&#x636E;&#x91CF;&#xFF09;">2. &#x7F29;&#x5C0F;<code>key</code>&#x7C92;&#x5EA6;&#xFF08;&#x589E;&#x5927;&#x6570;&#x636E;&#x503E;&#x659C;&#x53EF;&#x80FD;&#x6027;&#xFF0C;&#x964D;&#x4F4E;&#x6BCF;&#x4E2A;<code>task</code>&#x7684;&#x6570;&#x636E;&#x91CF;&#xFF09;</h3>
<p><code>key</code>&#x7684;&#x6570;&#x91CF;&#x589E;&#x52A0;&#xFF0C;&#x53EF;&#x80FD;&#x4F7F;&#x6570;&#x636E;&#x503E;&#x659C;&#x66F4;&#x4E25;&#x91CD;&#x3002;</p>
<h3 id="3-&#x589E;&#x5927;key&#x7C92;&#x5EA6;&#xFF08;&#x51CF;&#x5C0F;&#x6570;&#x636E;&#x503E;&#x659C;&#x53EF;&#x80FD;&#x6027;&#xFF0C;&#x589E;&#x5927;&#x6BCF;&#x4E2A;task&#x7684;&#x6570;&#x636E;&#x91CF;&#xFF09;">3. &#x589E;&#x5927;<code>key</code>&#x7C92;&#x5EA6;&#xFF08;&#x51CF;&#x5C0F;&#x6570;&#x636E;&#x503E;&#x659C;&#x53EF;&#x80FD;&#x6027;&#xFF0C;&#x589E;&#x5927;&#x6BCF;&#x4E2A;<code>task</code>&#x7684;&#x6570;&#x636E;&#x91CF;&#xFF09;</h3>
<p>&#x5982;&#x679C;&#x6CA1;&#x6709;&#x529E;&#x6CD5;&#x5BF9;&#x6BCF;&#x4E2A;<code>key</code>&#x805A;&#x5408;&#x51FA;&#x6765;&#x4E00;&#x6761;&#x6570;&#x636E;&#xFF0C;&#x5728;&#x7279;&#x5B9A;&#x573A;&#x666F;&#x4E0B;&#xFF0C;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x6269;&#x5927;<code>key</code>&#x7684;&#x805A;&#x5408;&#x7C92;&#x5EA6;&#x3002;</p>
<p>&#x4F8B;&#x5982;&#xFF0C;&#x76EE;&#x524D;&#x6709;<code>10&#x4E07;&#x6761;</code>&#x7528;&#x6237;&#x6570;&#x636E;&#xFF0C;&#x5F53;&#x524D;<code>key</code>&#x7684;&#x7C92;&#x5EA6;&#x662F;&#xFF08;&#x7701;&#xFF0C;&#x57CE;&#x5E02;&#xFF0C;&#x533A;&#xFF0C;&#x65E5;&#x671F;&#xFF09;&#xFF0C;&#x73B0;&#x5728;&#x6211;&#x4EEC;&#x8003;&#x8651;&#x6269;&#x5927;&#x7C92;&#x5EA6;&#xFF0C;&#x5C06;<code>key</code>&#x7684;&#x7C92;&#x5EA6;&#x6269;&#x5927;&#x4E3A;&#xFF08;&#x7701;&#xFF0C;&#x57CE;&#x5E02;&#xFF0C;&#x65E5;&#x671F;&#xFF09;&#xFF0C;&#x8FD9;&#x6837;&#x7684;&#x8BDD;&#xFF0C;<code>key</code>&#x7684;&#x6570;&#x91CF;&#x4F1A;&#x51CF;&#x5C11;&#xFF0C;<code>key</code>&#x4E4B;&#x95F4;&#x7684;&#x6570;&#x636E;&#x91CF;&#x5DEE;&#x5F02;&#x4E5F;&#x6709;&#x53EF;&#x80FD;&#x4F1A;&#x51CF;&#x5C11;&#xFF0C;&#x7531;&#x6B64;&#x53EF;&#x4EE5;&#x51CF;&#x8F7B;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x73B0;&#x8C61;&#x548C;&#x95EE;&#x9898;&#x3002;&#xFF08;&#x6B64;&#x65B9;&#x6CD5;&#x53EA;&#x9488;&#x5BF9;&#x7279;&#x5B9A;&#x7C7B;&#x578B;&#x7684;&#x6570;&#x636E;&#x6709;&#x6548;&#xFF0C;&#x5F53;&#x5E94;&#x7528;&#x573A;&#x666F;&#x4E0D;&#x9002;&#x5B9C;&#x65F6;&#xFF0C;&#x4F1A;&#x52A0;&#x91CD;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF09;</p>
<hr>
<h2 id="82-&#x8FC7;&#x6EE4;&#x5BFC;&#x81F4;&#x503E;&#x659C;&#x7684;key">8.2 &#x8FC7;&#x6EE4;&#x5BFC;&#x81F4;&#x503E;&#x659C;&#x7684;<code>key</code></h2>
<p>&#x5982;&#x679C;&#x5728; Spark &#x4F5C;&#x4E1A;&#x4E2D;&#x5141;&#x8BB8;&#x4E22;&#x5F03;&#x67D0;&#x4E9B;&#x6570;&#x636E;&#xFF0C;&#x90A3;&#x4E48;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x5C06;&#x53EF;&#x80FD;&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684; key &#x8FDB;&#x884C;&#x8FC7;&#x6EE4;&#xFF0C;&#x6EE4;&#x9664;&#x53EF;&#x80FD;&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;key&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x8FD9;&#x6837;&#xFF0C;&#x5728;Spark&#x4F5C;&#x4E1A;&#x4E2D;&#x5C31;&#x4E0D;&#x4F1A;&#x53D1;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#x4E86;&#x3002;</p>
<hr>
<h2 id="83-&#x63D0;&#x9AD8;shuffle&#x64CD;&#x4F5C;&#x4E2D;&#x7684;reduce&#x5E76;&#x884C;&#x5EA6;">8.3 &#x63D0;&#x9AD8;<code>shuffle</code>&#x64CD;&#x4F5C;&#x4E2D;&#x7684;<code>reduce</code>&#x5E76;&#x884C;&#x5EA6;</h2>
<p>&#x5F53;&#x65B9;&#x6848;&#x4E00;&#x548C;&#x65B9;&#x6848;&#x4E8C;&#x5BF9;&#x4E8E;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x5904;&#x7406;&#x6CA1;&#x6709;&#x5F88;&#x597D;&#x7684;&#x6548;&#x679C;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x63D0;&#x9AD8;<code>shuffle</code>&#x8FC7;&#x7A0B;&#x4E2D;&#x7684;<code>reduce</code>&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#xFF0C;<code>reduce</code>&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x7684;&#x63D0;&#x9AD8;&#x5C31;&#x589E;&#x52A0;&#x4E86;<code>reduce</code>&#x7AEF;<code>task</code>&#x7684;&#x6570;&#x91CF;&#xFF0C;&#x90A3;&#x4E48;&#x6BCF;&#x4E2A;<code>task</code>&#x5206;&#x914D;&#x5230;&#x7684;&#x6570;&#x636E;&#x91CF;&#x5C31;&#x4F1A;&#x76F8;&#x5E94;&#x51CF;&#x5C11;&#xFF0C;&#x7531;&#x6B64;&#x7F13;&#x89E3;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x3002;</p>
<h3 id="1-reduce&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x7684;&#x8BBE;&#x7F6E;">1. <code>reduce</code>&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x7684;&#x8BBE;&#x7F6E;</h3>
<p>&#x5728;&#x5927;&#x90E8;&#x5206;&#x7684;<code>shuffle</code>&#x7B97;&#x5B50;&#x4E2D;&#xFF0C;&#x90FD;&#x53EF;&#x4EE5;&#x4F20;&#x5165;&#x4E00;&#x4E2A;&#x5E76;&#x884C;&#x5EA6;&#x7684;&#x8BBE;&#x7F6E;&#x53C2;&#x6570;&#xFF0C;&#x6BD4;&#x5982;<code>reduceByKey(500)</code>&#xFF0C;&#x8FD9;&#x4E2A;&#x53C2;&#x6570;&#x4F1A;&#x51B3;&#x5B9A;<code>shuffle</code>&#x8FC7;&#x7A0B;&#x4E2D;<code>reduce</code>&#x7AEF;&#x7684;&#x5E76;&#x884C;&#x5EA6;&#xFF0C;&#x5728;&#x8FDB;&#x884C;<code>shuffle</code>&#x64CD;&#x4F5C;&#x7684;&#x65F6;&#x5019;&#xFF0C;&#x5C31;&#x4F1A;&#x5BF9;&#x5E94;&#x7740;&#x521B;&#x5EFA;&#x6307;&#x5B9A;&#x6570;&#x91CF;&#x7684;<code>reduce task</code>&#x3002;</p>
<p>&#x5BF9;&#x4E8E;Spark SQL&#x4E2D;&#x7684;<code>shuffle</code>&#x7C7B;&#x8BED;&#x53E5;&#xFF0C;&#x6BD4;&#x5982;<code>group by&#x3001;join</code>&#x7B49;&#xFF0C;&#x9700;&#x8981;&#x8BBE;&#x7F6E;&#x4E00;&#x4E2A;&#x53C2;&#x6570;&#xFF0C;&#x5373;<code>spark.sql.shuffle.partitions</code>&#xFF0C;&#x8BE5;&#x53C2;&#x6570;&#x4EE3;&#x8868;&#x4E86;<code>shuffle read task</code>&#x7684;&#x5E76;&#x884C;&#x5EA6;&#xFF0C;&#x8BE5;&#x503C;&#x9ED8;&#x8BA4;&#x662F;<code>200</code>&#xFF0C;&#x5BF9;&#x4E8E;&#x5F88;&#x591A;&#x573A;&#x666F;&#x6765;&#x8BF4;&#x90FD;&#x6709;&#x70B9;&#x8FC7;&#x5C0F;&#x3002;</p>
<p>&#x589E;&#x52A0;<code>shuffle read task</code>&#x7684;&#x6570;&#x91CF;&#xFF0C;&#x53EF;&#x4EE5;&#x8BA9;&#x539F;&#x672C;&#x5206;&#x914D;&#x7ED9;&#x4E00;&#x4E2A;<code>task</code>&#x7684;&#x591A;&#x4E2A;<code>key</code>&#x5206;&#x914D;&#x7ED9;&#x591A;&#x4E2A;<code>task</code>&#xFF0C;&#x4ECE;&#x800C;&#x8BA9;&#x6BCF;&#x4E2A;<code>task</code>&#x5904;&#x7406;&#x6BD4;&#x539F;&#x6765;&#x66F4;&#x5C11;&#x7684;&#x6570;&#x636E;&#x3002;</p>
<p>&#x4E3E;&#x4F8B;&#x6765;&#x8BF4;&#xFF0C;&#x5982;&#x679C;&#x539F;&#x672C;&#x6709;<code>5</code>&#x4E2A;<code>key</code>&#xFF0C;&#x6BCF;&#x4E2A;<code>key</code>&#x5BF9;&#x5E94;<code>10</code>&#x6761;&#x6570;&#x636E;&#xFF0C;&#x8FD9;<code>5</code>&#x4E2A;<code>key</code>&#x90FD;&#x662F;&#x5206;&#x914D;&#x7ED9;&#x4E00;&#x4E2A;<code>task</code>&#x7684;&#xFF0C;&#x90A3;&#x4E48;&#x8FD9;&#x4E2A;<code>task</code>&#x5C31;&#x8981;&#x5904;&#x7406;<code>50</code>&#x6761;&#x6570;&#x636E;&#x3002;&#x800C;&#x589E;&#x52A0;&#x4E86;<code>shuffle read task</code>&#x4EE5;&#x540E;&#xFF0C;&#x6BCF;&#x4E2A;<code>task</code>&#x5C31;&#x5206;&#x914D;&#x5230;&#x4E00;&#x4E2A;<code>key</code>&#xFF0C;&#x5373;&#x6BCF;&#x4E2A;<code>task</code>&#x5C31;&#x5904;&#x7406;<code>10</code>&#x6761;&#x6570;&#x636E;&#xFF0C;&#x90A3;&#x4E48;&#x81EA;&#x7136;&#x6BCF;&#x4E2A;<code>task</code>&#x7684;&#x6267;&#x884C;&#x65F6;&#x95F4;&#x90FD;&#x4F1A;&#x53D8;&#x77ED;&#x4E86;&#x3002;</p>
<h3 id="2-reduce&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x8BBE;&#x7F6E;&#x5B58;&#x5728;&#x7684;&#x7F3A;&#x9677;">2. <code>reduce</code>&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x8BBE;&#x7F6E;&#x5B58;&#x5728;&#x7684;&#x7F3A;&#x9677;</h3>
<p>&#x63D0;&#x9AD8;<code>reduce</code>&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x5E76;&#x6CA1;&#x6709;&#x4ECE;&#x6839;&#x672C;&#x4E0A;&#x6539;&#x53D8;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x672C;&#x8D28;&#x548C;&#x95EE;&#x9898;&#xFF08;&#x65B9;&#x6848;&#x4E00;&#x548C;&#x65B9;&#x6848;&#x4E8C;&#x4ECE;&#x6839;&#x672C;&#x4E0A;&#x907F;&#x514D;&#x4E86;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x53D1;&#x751F;&#xFF09;&#xFF0C;&#x53EA;&#x662F;&#x5C3D;&#x53EF;&#x80FD;&#x5730;&#x53BB;&#x7F13;&#x89E3;&#x548C;&#x51CF;&#x8F7B;<code>shuffle reduce task</code>&#x7684;&#x6570;&#x636E;&#x538B;&#x529B;&#xFF0C;&#x4EE5;&#x53CA;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x95EE;&#x9898;&#xFF0C;&#x9002;&#x7528;&#x4E8E;&#x6709;&#x8F83;&#x591A;<code>key</code>&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#x91CF;&#x90FD;&#x6BD4;&#x8F83;&#x5927;&#x7684;&#x60C5;&#x51B5;&#x3002;</p>
<p>&#x8BE5;&#x65B9;&#x6848;&#x901A;&#x5E38;&#x65E0;&#x6CD5;&#x5F7B;&#x5E95;&#x89E3;&#x51B3;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x56E0;&#x4E3A;&#x5982;&#x679C;&#x51FA;&#x73B0;&#x4E00;&#x4E9B;&#x6781;&#x7AEF;&#x60C5;&#x51B5;&#xFF0C;&#x6BD4;&#x5982;&#x67D0;&#x4E2A;<code>key</code>&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#x91CF;&#x6709;<code>100&#x4E07;</code>&#xFF0C;&#x90A3;&#x4E48;&#x65E0;&#x8BBA;&#x4F60;&#x7684;<code>task</code>&#x6570;&#x91CF;&#x589E;&#x52A0;&#x5230;&#x591A;&#x5C11;&#xFF0C;&#x8FD9;&#x4E2A;&#x5BF9;&#x5E94;&#x7740;<code>100&#x4E07;</code>&#x6570;&#x636E;&#x7684;<code>key</code>&#x80AF;&#x5B9A;&#x8FD8;&#x662F;&#x4F1A;&#x5206;&#x914D;&#x5230;&#x4E00;&#x4E2A;<code>task</code>&#x4E2D;&#x53BB;&#x5904;&#x7406;&#xFF0C;&#x56E0;&#x6B64;&#x6CE8;&#x5B9A;&#x8FD8;&#x662F;&#x4F1A;&#x53D1;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x3002;&#x6240;&#x4EE5;&#x8FD9;&#x79CD;&#x65B9;&#x6848;&#x53EA;&#x80FD;&#x8BF4;&#x662F;&#x5728;&#x53D1;&#x73B0;&#x6570;&#x636E;&#x503E;&#x659C;&#x65F6;&#x5C1D;&#x8BD5;&#x4F7F;&#x7528;&#x7684;&#x7B2C;&#x4E00;&#x79CD;&#x624B;&#x6BB5;&#xFF0C;&#x5C1D;&#x8BD5;&#x53BB;&#x7528;&#x6700;&#x7B80;&#x5355;&#x7684;&#x65B9;&#x6CD5;&#x7F13;&#x89E3;&#x6570;&#x636E;&#x503E;&#x659C;&#x800C;&#x5DF2;&#xFF0C;&#x6216;&#x8005;&#x662F;&#x548C;&#x5176;&#x4ED6;&#x65B9;&#x6848;&#x7ED3;&#x5408;&#x8D77;&#x6765;&#x4F7F;&#x7528;&#x3002;</p>
<p>&#x5728;&#x7406;&#x60F3;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;<code>reduce</code>&#x7AEF;&#x5E76;&#x884C;&#x5EA6;&#x63D0;&#x5347;&#x540E;&#xFF0C;&#x4F1A;&#x5728;&#x4E00;&#x5B9A;&#x7A0B;&#x5EA6;&#x4E0A;&#x51CF;&#x8F7B;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x95EE;&#x9898;&#xFF0C;&#x751A;&#x81F3;&#x57FA;&#x672C;&#x6D88;&#x9664;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF1B;&#x4F46;&#x662F;&#xFF0C;&#x5728;&#x4E00;&#x4E9B;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;&#x53EA;&#x4F1A;&#x8BA9;&#x539F;&#x6765;&#x7531;&#x4E8E;&#x6570;&#x636E;&#x503E;&#x659C;&#x800C;&#x8FD0;&#x884C;&#x7F13;&#x6162;&#x7684;<code>task</code>&#x8FD0;&#x884C;&#x901F;&#x5EA6;&#x7A0D;&#x6709;&#x63D0;&#x5347;&#xFF0C;&#x6216;&#x8005;&#x907F;&#x514D;&#x4E86;&#x67D0;&#x4E9B;<code>task</code>&#x7684;<code>OOM</code>&#x95EE;&#x9898;&#xFF0C;&#x4F46;&#x662F;&#xFF0C;&#x4ECD;&#x7136;&#x8FD0;&#x884C;&#x7F13;&#x6162;&#xFF0C;&#x6B64;&#x65F6;&#xFF0C;&#x8981;&#x53CA;&#x65F6;&#x653E;&#x5F03;&#x65B9;&#x6848;&#x4E09;&#xFF0C;&#x5F00;&#x59CB;&#x5C1D;&#x8BD5;&#x540E;&#x9762;&#x7684;&#x65B9;&#x6848;&#x3002;</p>
<hr>
<h2 id="84-&#x4F7F;&#x7528;&#x968F;&#x673A;key&#x5B9E;&#x73B0;&#x53CC;&#x91CD;&#x805A;&#x5408;">8.4 &#x4F7F;&#x7528;&#x968F;&#x673A;<code>key</code>&#x5B9E;&#x73B0;&#x53CC;&#x91CD;&#x805A;&#x5408;</h2>
<p>&#x5F53;&#x4F7F;&#x7528;&#x4E86;&#x7C7B;&#x4F3C;&#x4E8E;<code>groupByKey</code>&#x3001;<code>reduceByKey</code>&#x8FD9;&#x6837;&#x7684;&#x7B97;&#x5B50;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x4F7F;&#x7528;&#x968F;&#x673A;<code>key</code>&#x5B9E;&#x73B0;&#x53CC;&#x91CD;&#x805A;&#x5408;</p>
<p><img src="http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/1554856323.png-atguiguText" alt=""></p>
<p>&#x9996;&#x5148;&#xFF0C;&#x901A;&#x8FC7;<code>map</code>&#x7B97;&#x5B50;&#x7ED9;&#x6BCF;&#x4E2A;&#x6570;&#x636E;&#x7684;<code>key</code>&#x6DFB;&#x52A0;&#x968F;&#x673A;&#x6570;&#x524D;&#x7F00;&#xFF0C;&#x5BF9;<code>key</code>&#x8FDB;&#x884C;&#x6253;&#x6563;&#xFF0C;&#x5C06;&#x539F;&#x5148;&#x4E00;&#x6837;&#x7684;<code>key</code>&#x53D8;&#x6210;&#x4E0D;&#x4E00;&#x6837;&#x7684;<code>key</code>&#xFF0C;&#x7136;&#x540E;&#x8FDB;&#x884C;&#x7B2C;&#x4E00;&#x6B21;&#x805A;&#x5408;&#xFF0C;&#x8FD9;&#x6837;&#x5C31;&#x53EF;&#x4EE5;&#x8BA9;&#x539F;&#x672C;&#x88AB;&#x4E00;&#x4E2A;task&#x5904;&#x7406;&#x7684;&#x6570;&#x636E;&#x5206;&#x6563;&#x5230;&#x591A;&#x4E2A;<code>task</code>&#x4E0A;&#x53BB;&#x505A;&#x5C40;&#x90E8;&#x805A;&#x5408;&#xFF1B;</p>
<p>&#x968F;&#x540E;&#xFF0C;&#x53BB;&#x9664;&#x6389;&#x6BCF;&#x4E2A;<code>key</code>&#x7684;&#x524D;&#x7F00;&#xFF0C;&#x518D;&#x6B21;&#x8FDB;&#x884C;&#x805A;&#x5408;&#x3002;</p>
<p>&#x6B64;&#x65B9;&#x6CD5;&#x5BF9;&#x4E8E;&#x7531;<code>groupByKey</code>&#x3001;<code>reduceByKey</code>&#x8FD9;&#x7C7B;&#x7B97;&#x5B50;&#x9020;&#x6210;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#x7531;&#x6BD4;&#x8F83;&#x597D;&#x7684;&#x6548;&#x679C;&#xFF0C;&#x4EC5;&#x4EC5;&#x9002;&#x7528;&#x4E8E;&#x805A;&#x5408;&#x7C7B;&#x7684;<code>shuffle</code>&#x64CD;&#x4F5C;&#xFF0C;&#x9002;&#x7528;&#x8303;&#x56F4;&#x76F8;&#x5BF9;&#x8F83;&#x7A84;&#x3002;</p>
<p>&#x5982;&#x679C;&#x662F;<code>join</code>&#x7C7B;&#x7684;<code>shuffle</code>&#x64CD;&#x4F5C;&#xFF0C;&#x8FD8;&#x5F97;&#x7528;&#x5176;&#x4ED6;&#x7684;&#x89E3;&#x51B3;&#x65B9;&#x6848;&#x3002;</p>
<p>&#x6B64;&#x65B9;&#x6CD5;&#x4E5F;&#x662F;&#x524D;&#x51E0;&#x79CD;&#x65B9;&#x6848;&#x6CA1;&#x6709;&#x6BD4;&#x8F83;&#x597D;&#x7684;&#x6548;&#x679C;&#x65F6;&#x8981;&#x5C1D;&#x8BD5;&#x7684;&#x89E3;&#x51B3;&#x65B9;&#x6848;&#x3002;</p>
<hr>
<h2 id="85-&#x5C06;reduce-join&#x8F6C;&#x6362;&#x4E3A;map-join">8.5 &#x5C06;<code>reduce join</code>&#x8F6C;&#x6362;&#x4E3A;<code>map join</code></h2>
<p>&#x6B63;&#x5E38;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;<code>join</code>&#x64CD;&#x4F5C;&#x90FD;&#x4F1A;&#x6267;&#x884C;<code>shuffle</code>&#x8FC7;&#x7A0B;&#xFF0C;&#x5E76;&#x4E14;&#x6267;&#x884C;&#x7684;&#x662F;<code>reduce join</code>&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x5148;&#x5C06;&#x6240;&#x6709;&#x76F8;&#x540C;&#x7684;<code>key</code>&#x548C;&#x5BF9;&#x5E94;&#x7684;<code>value</code>&#x6C47;&#x805A;&#x5230;&#x4E00;&#x4E2A;<code>reduce task</code>&#x4E2D;&#xFF0C;&#x7136;&#x540E;&#x518D;&#x8FDB;&#x884C;<code>join</code>&#x3002;</p>
<p>&#x666E;&#x901A;<code>join</code>&#x7684;&#x8FC7;&#x7A0B;&#x5982;&#x4E0B;&#x56FE;&#x6240;&#x793A;&#xFF1A;</p>
<p><img src="http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/1554856487.png-atguiguText" alt=""></p>
<p>&#x666E;&#x901A;&#x7684;<code>join</code>&#x662F;&#x4F1A;&#x8D70;<code>shuffle</code>&#x8FC7;&#x7A0B;&#x7684;&#xFF0C;&#x800C;&#x4E00;&#x65E6;<code>shuffle</code>&#xFF0C;&#x5C31;&#x76F8;&#x5F53;&#x4E8E;&#x4F1A;&#x5C06;&#x76F8;&#x540C;<code>key</code>&#x7684;&#x6570;&#x636E;&#x62C9;&#x53D6;&#x5230;&#x4E00;&#x4E2A;<code>shuffle read task</code>&#x4E2D;&#x518D;&#x8FDB;&#x884C;<code>join</code>&#xFF0C;&#x6B64;&#x65F6;&#x5C31;&#x662F;<code>reduce join</code>&#x3002;</p>
<p>&#x4F46;&#x662F;&#x5982;&#x679C;&#x4E00;&#x4E2A;<code>RDD</code>&#x662F;&#x6BD4;&#x8F83;&#x5C0F;&#x7684;&#xFF0C;&#x5219;&#x53EF;&#x4EE5;&#x91C7;&#x7528;&#x5E7F;&#x64AD;<code>&#x5C0F;RDD&#x5168;&#x91CF;&#x6570;&#x636E;+map&#x7B97;&#x5B50;</code>&#x6765;&#x5B9E;&#x73B0;&#x4E0E;<code>join</code>&#x540C;&#x6837;&#x7684;&#x6548;&#x679C;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;<code>map join</code>&#xFF0C;&#x6B64;&#x65F6;&#x5C31;&#x4E0D;&#x4F1A;&#x53D1;&#x751F;<code>shuffle</code>&#x64CD;&#x4F5C;&#xFF0C;&#x4E5F;&#x5C31;&#x4E0D;&#x4F1A;&#x53D1;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#x3002;</p>
<my>&#xFF08;&#x6CE8;&#x610F;&#xFF0C;RDD&#x662F;&#x5E76;&#x4E0D;&#x80FD;&#x8FDB;&#x884C;&#x5E7F;&#x64AD;&#x7684;&#xFF0C;&#x53EA;&#x80FD;&#x5C06;RDD&#x5185;&#x90E8;&#x7684;&#x6570;&#x636E;&#x901A;&#x8FC7;collect&#x62C9;&#x53D6;&#x5230;Driver&#x5185;&#x5B58;&#x7136;&#x540E;&#x518D;&#x8FDB;&#x884C;&#x5E7F;&#x64AD;&#xFF09;</my>

<h3 id="&#x6838;&#x5FC3;&#x601D;&#x60F3;">&#x6838;&#x5FC3;&#x601D;&#x60F3;</h3>
<p>&#x4E0D;&#x4F7F;&#x7528;<code>join</code>&#x7B97;&#x5B50;&#x8FDB;&#x884C;&#x8FDE;&#x63A5;&#x64CD;&#x4F5C;&#xFF0C;&#x800C;&#x4F7F;&#x7528;<code>Broadcast</code>&#x53D8;&#x91CF;&#x4E0E;<code>map</code>&#x7C7B;&#x7B97;&#x5B50;&#x5B9E;&#x73B0;<code>join</code>&#x64CD;&#x4F5C;&#xFF0C;&#x8FDB;&#x800C;&#x5B8C;&#x5168;&#x89C4;&#x907F;&#x6389;<code>shuffle</code>&#x7C7B;&#x7684;&#x64CD;&#x4F5C;&#xFF0C;&#x5F7B;&#x5E95;&#x907F;&#x514D;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;&#x53D1;&#x751F;&#x548C;&#x51FA;&#x73B0;&#x3002;</p>
<p>&#x5C06;&#x8F83;&#x5C0F; RDD &#x4E2D;&#x7684;&#x6570;&#x636E;&#x76F4;&#x63A5;&#x901A;&#x8FC7;<code>collect</code>&#x7B97;&#x5B50;&#x62C9;&#x53D6;&#x5230;<code>Driver</code>&#x7AEF;&#x7684;&#x5185;&#x5B58;&#x4E2D;&#x6765;&#xFF0C;&#x7136;&#x540E;&#x5BF9;&#x5176;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;<code>Broadcast</code>&#x53D8;&#x91CF;&#xFF1B;</p>
<p>&#x63A5;&#x7740;&#x5BF9;&#x53E6;&#x5916;&#x4E00;&#x4E2A;<code>RDD</code>&#x6267;&#x884C;<code>map</code>&#x7C7B;&#x7B97;&#x5B50;&#xFF0C;&#x5728;&#x7B97;&#x5B50;&#x51FD;&#x6570;&#x5185;&#xFF0C;&#x4ECE;<code>Broadcast</code>&#x53D8;&#x91CF;&#x4E2D;&#x83B7;&#x53D6;&#x8F83;&#x5C0F;<code>RDD</code>&#x7684;&#x5168;&#x91CF;&#x6570;&#x636E;&#xFF0C;&#x4E0E;&#x5F53;&#x524D;<code>RDD</code>&#x7684;&#x6BCF;&#x4E00;&#x6761;&#x6570;&#x636E;&#x6309;&#x7167;&#x8FDE;&#x63A5;<code>key</code>&#x8FDB;&#x884C;&#x6BD4;&#x5BF9;&#xFF0C;&#x5982;&#x679C;&#x8FDE;&#x63A5;<code>key</code>&#x76F8;&#x540C;&#x7684;&#x8BDD;&#xFF0C;&#x90A3;&#x4E48;&#x5C31;&#x5C06;&#x4E24;&#x4E2A;<code>RDD</code>&#x7684;&#x6570;&#x636E;&#x7528;&#x4F60;&#x9700;&#x8981;&#x7684;&#x65B9;&#x5F0F;&#x8FDE;&#x63A5;&#x8D77;&#x6765;&#x3002;</p>
<p>&#x6839;&#x636E;&#x4E0A;&#x8FF0;&#x601D;&#x8DEF;&#xFF0C;&#x6839;&#x672C;&#x4E0D;&#x4F1A;&#x53D1;&#x751F;<code>shuffle</code>&#x64CD;&#x4F5C;&#xFF0C;&#x4ECE;&#x6839;&#x672C;&#x4E0A;&#x675C;&#x7EDD;&#x4E86;<code>join</code>&#x64CD;&#x4F5C;&#x53EF;&#x80FD;&#x5BFC;&#x81F4;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x3002;</p>
<p>&#x5F53;<code>join</code>&#x64CD;&#x4F5C;&#x6709;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x5E76;&#x4E14;&#x5176;&#x4E2D;&#x4E00;&#x4E2A;<code>RDD</code>&#x7684;&#x6570;&#x636E;&#x91CF;&#x8F83;&#x5C0F;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x4F18;&#x5148;&#x8003;&#x8651;&#x8FD9;&#x79CD;&#x65B9;&#x5F0F;&#xFF0C;&#x6548;&#x679C;&#x975E;&#x5E38;&#x597D;&#x3002;<code>map join</code>&#x7684;&#x8FC7;&#x7A0B;&#x5982;&#x56FE;:</p>
<p><img src="http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/1554857233.png-atguiguText" alt=""></p>
<h3 id="&#x4E0D;&#x9002;&#x7528;&#x573A;&#x666F;&#x5206;&#x6790;">&#x4E0D;&#x9002;&#x7528;&#x573A;&#x666F;&#x5206;&#x6790;</h3>
<p>&#x7531;&#x4E8E; Spark &#x7684;&#x5E7F;&#x64AD;&#x53D8;&#x91CF;&#x662F;&#x5728;&#x6BCF;&#x4E2A;<code>Executor</code>&#x4E2D;&#x4FDD;&#x5B58;&#x4E00;&#x4E2A;&#x526F;&#x672C;&#xFF0C;&#x5982;&#x679C;&#x4E24;&#x4E2A;<code>RDD</code>&#x6570;&#x636E;&#x91CF;&#x90FD;&#x6BD4;&#x8F83;&#x5927;&#xFF0C;&#x90A3;&#x4E48;&#x5982;&#x679C;&#x5C06;&#x4E00;&#x4E2A;&#x6570;&#x636E;&#x91CF;&#x6BD4;&#x8F83;&#x5927;&#x7684; RDD &#x505A;&#x6210;&#x5E7F;&#x64AD;&#x53D8;&#x91CF;&#xFF0C;&#x90A3;&#x4E48;&#x5F88;&#x6709;&#x53EF;&#x80FD;&#x4F1A;&#x9020;&#x6210;&#x5185;&#x5B58;&#x6EA2;&#x51FA;</p>
<hr>
<h2 id="86-sample&#x91C7;&#x6837;&#x5BF9;&#x503E;&#x659C;key&#x5355;&#x72EC;&#x8FDB;&#x884C;join">8.6 <code>sample</code>&#x91C7;&#x6837;&#x5BF9;&#x503E;&#x659C;<code>key</code>&#x5355;&#x72EC;&#x8FDB;&#x884C;<code>join</code></h2>
<p>&#x5728; Spark &#x4E2D;&#xFF0C;&#x5982;&#x679C;&#x67D0;&#x4E2A;<code>RDD</code>&#x53EA;&#x6709;&#x4E00;&#x4E2A;<code>key</code>&#xFF0C;&#x90A3;&#x4E48;&#x5728;<code>shuffle</code>&#x8FC7;&#x7A0B;&#x4E2D;&#x4F1A;&#x9ED8;&#x8BA4;&#x5C06;&#x6B64;<code>key</code>&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#x6253;&#x6563;&#xFF0C;&#x7531;&#x4E0D;&#x540C;&#x7684;<code>reduce</code>&#x7AEF;<code>task</code>&#x8FDB;&#x884C;&#x5904;&#x7406;&#x3002;</p>
<p>&#x6240;&#x4EE5;, &#x5F53;&#x7531;&#x5355;&#x4E2A;<code>key</code>&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#x65F6;&#xFF0C;&#x53EF;&#x6709;&#x5C06;&#x53D1;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;<code>key</code>&#x5355;&#x72EC;&#x63D0;&#x53D6;&#x51FA;&#x6765;&#xFF0C;&#x7EC4;&#x6210;&#x4E00;&#x4E2A;<code>RDD</code>&#xFF0C;&#x7136;&#x540E;&#x7528;&#x8FD9;&#x4E2A;&#x539F;&#x672C;&#x4F1A;&#x5BFC;&#x81F4;&#x503E;&#x659C;&#x7684;<code>key</code>&#x7EC4;&#x6210;&#x7684;<code>RDD</code>&#x8DDF;&#x5176;&#x4ED6;<code>RDD</code>&#x5355;&#x72EC;<code>join</code>&#xFF0C;&#x6B64;&#x65F6;&#xFF0C;&#x6839;&#x636E; Spark &#x7684;&#x8FD0;&#x884C;&#x673A;&#x5236;&#xFF0C;&#x6B64; RDD &#x4E2D;&#x7684;&#x6570;&#x636E;&#x4F1A;&#x5728;<code>shuffle</code>&#x9636;&#x6BB5;&#x88AB;&#x5206;&#x6563;&#x5230;&#x591A;&#x4E2A;<code>task</code>&#x4E2D;&#x53BB;&#x8FDB;&#x884C;<code>join</code>&#x64CD;&#x4F5C;&#x3002;&#x503E;&#x659C;<code>key</code>&#x5355;&#x72EC;<code>join</code>&#x7684;&#x6D41;&#x7A0B;&#x5982;&#x56FE;</p>
<p><img src="http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/1554857498.png-atguiguText" alt=""></p>
<h3 id="&#x9002;&#x7528;&#x573A;&#x666F;&#x5206;&#x6790;">&#x9002;&#x7528;&#x573A;&#x666F;&#x5206;&#x6790;</h3>
<p>&#x5BF9;&#x4E8E;<code>RDD</code>&#x4E2D;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x53EF;&#x4EE5;&#x5C06;&#x5176;&#x8F6C;&#x6362;&#x4E3A;&#x4E00;&#x4E2A;&#x4E2D;&#x95F4;&#x8868;&#xFF0C;&#x6216;&#x8005;&#x662F;&#x76F4;&#x63A5;&#x4F7F;&#x7528;<code>countByKey()</code>&#x7684;&#x65B9;&#x5F0F;&#xFF0C;&#x770B;&#x4E00;&#x4E2A;&#x8FD9;&#x4E2A;<code>RDD</code>&#x4E2D;&#x5404;&#x4E2A;<code>key</code>&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#x91CF;&#xFF0C;&#x6B64;&#x65F6;&#x5982;&#x679C;&#x4F60;&#x53D1;&#x73B0;&#x6574;&#x4E2A;<code>RDD</code>&#x5C31;&#x4E00;&#x4E2A;<code>key</code>&#x7684;&#x6570;&#x636E;&#x91CF;&#x7279;&#x522B;&#x591A;&#xFF0C;&#x90A3;&#x4E48;&#x5C31;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x4F7F;&#x7528;&#x8FD9;&#x79CD;&#x65B9;&#x6CD5;&#x3002;</p>
<p>&#x5F53;&#x6570;&#x636E;&#x91CF;&#x975E;&#x5E38;&#x5927;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x4F7F;&#x7528;<code>sample</code>&#x91C7;&#x6837;&#x83B7;&#x53D6;<code>10%</code>&#x7684;&#x6570;&#x636E;&#xFF0C;&#x7136;&#x540E;&#x5206;&#x6790;&#x8FD9;<code>10%</code>&#x7684;&#x6570;&#x636E;&#x4E2D;&#x54EA;&#x4E2A;<code>key</code>&#x53EF;&#x80FD;&#x4F1A;&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x7136;&#x540E;&#x5C06;&#x8FD9;&#x4E2A;<code>key</code>&#x5BF9;&#x5E94;&#x7684;&#x6570;&#x636E;&#x5355;&#x72EC;&#x63D0;&#x53D6;&#x51FA;&#x6765;&#x3002;</p>
<h3 id="&#x4E0D;&#x9002;&#x7528;&#x573A;&#x666F;&#x5206;&#x6790;">&#x4E0D;&#x9002;&#x7528;&#x573A;&#x666F;&#x5206;&#x6790;</h3>
<p>&#x5982;&#x679C;&#x4E00;&#x4E2A;<code>RDD</code>&#x4E2D;&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#x7684;<code>key</code>&#x5F88;&#x591A;&#xFF0C;&#x90A3;&#x4E48;&#x6B64;&#x65B9;&#x6848;&#x4E0D;&#x9002;&#x7528;</p>
<hr>
<h2 id="87-&#x4F7F;&#x7528;&#x968F;&#x673A;&#x6570;&#x4EE5;&#x53CA;&#x6269;&#x5BB9;&#x8FDB;&#x884C;join">8.7 &#x4F7F;&#x7528;&#x968F;&#x673A;&#x6570;&#x4EE5;&#x53CA;&#x6269;&#x5BB9;&#x8FDB;&#x884C;<code>join</code></h2>
<p>&#x5982;&#x679C;&#x5728;&#x8FDB;&#x884C;<code>join</code>&#x64CD;&#x4F5C;&#x65F6;&#xFF0C;<code>RDD</code>&#x4E2D;&#x6709;&#x5927;&#x91CF;&#x7684;<code>key</code>&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x90A3;&#x4E48;&#x8FDB;&#x884C;&#x5206;&#x62C6;<code>key</code>&#x4E5F;&#x6CA1;&#x4EC0;&#x4E48;&#x610F;&#x4E49;&#xFF0C;&#x6B64;&#x65F6;&#x5C31;&#x53EA;&#x80FD;&#x4F7F;&#x7528;&#x6700;&#x540E;&#x4E00;&#x79CD;&#x65B9;&#x6848;&#x6765;&#x89E3;&#x51B3;&#x95EE;&#x9898;&#x4E86;&#xFF0C;&#x5BF9;&#x4E8E;<code>join</code>&#x64CD;&#x4F5C;&#xFF0C;&#x6211;&#x4EEC;&#x53EF;&#x4EE5;&#x8003;&#x8651;&#x5BF9;&#x5176;&#x4E2D;&#x4E00;&#x4E2A;<code>RDD</code>&#x6570;&#x636E;&#x8FDB;&#x884C;&#x6269;&#x5BB9;&#xFF0C;&#x53E6;&#x4E00;&#x4E2A;<code>RDD</code>&#x8FDB;&#x884C;&#x7A00;&#x91CA;&#x540E;&#x518D;<code>join</code>&#x3002;</p>
<p>&#x6211;&#x4EEC;&#x4F1A;&#x5C06;&#x539F;&#x5148;&#x4E00;&#x6837;&#x7684;<code>key</code>&#x901A;&#x8FC7;&#x9644;&#x52A0;&#x968F;&#x673A;&#x524D;&#x7F00;&#x53D8;&#x6210;&#x4E0D;&#x4E00;&#x6837;&#x7684;<code>key</code>&#xFF0C;&#x7136;&#x540E;&#x5C31;&#x53EF;&#x4EE5;&#x5C06;&#x8FD9;&#x4E9B;&#x5904;&#x7406;&#x540E;&#x7684;&#x201C;&#x4E0D;&#x540C;<code>key</code>&#x201D;&#x5206;&#x6563;&#x5230;&#x591A;&#x4E2A;<code>task</code>&#x4E2D;&#x53BB;&#x5904;&#x7406;&#xFF0C;&#x800C;&#x4E0D;&#x662F;&#x8BA9;&#x4E00;&#x4E2A;<code>task</code>&#x5904;&#x7406;&#x5927;&#x91CF;&#x7684;&#x76F8;&#x540C;<code>key</code>&#x3002;</p>
<p>&#x8FD9;&#x4E00;&#x79CD;&#x65B9;&#x6848;&#x662F;&#x9488;&#x5BF9;&#x6709;&#x5927;&#x91CF;&#x503E;&#x659C;<code>key</code>&#x7684;&#x60C5;&#x51B5;&#xFF0C;&#x6CA1;&#x6CD5;&#x5C06;&#x90E8;&#x5206;<code>key</code>&#x62C6;&#x5206;&#x51FA;&#x6765;&#x8FDB;&#x884C;&#x5355;&#x72EC;&#x5904;&#x7406;&#xFF0C;&#x9700;&#x8981;&#x5BF9;&#x6574;&#x4E2A;<code>RDD</code>&#x8FDB;&#x884C;&#x6570;&#x636E;&#x6269;&#x5BB9;&#xFF0C;&#x5BF9;&#x5185;&#x5B58;&#x8D44;&#x6E90;&#x8981;&#x6C42;&#x5F88;&#x9AD8;&#x3002;</p>
<h3 id="&#x6838;&#x5FC3;&#x601D;&#x60F3;">&#x6838;&#x5FC3;&#x601D;&#x60F3;</h3>
<p>&#x9009;&#x62E9;&#x4E00;&#x4E2A;<code>RDD</code>&#xFF0C;&#x4F7F;&#x7528;<code>flatMap</code>&#x8FDB;&#x884C;&#x6269;&#x5BB9;&#xFF0C;&#x5BF9;&#x6BCF;&#x6761;&#x6570;&#x636E;&#x7684;<code>key</code>&#x6DFB;&#x52A0;&#x6570;&#x503C;&#x524D;&#x7F00;&#xFF08;1~N&#x7684;&#x6570;&#x503C;&#xFF09;&#xFF0C;&#x5C06;&#x4E00;&#x6761;&#x6570;&#x636E;&#x6620;&#x5C04;&#x4E3A;&#x591A;&#x6761;&#x6570;&#x636E;&#xFF1B;&#xFF08;&#x6269;&#x5BB9;&#xFF09;</p>
<p>&#x9009;&#x62E9;&#x53E6;&#x5916;&#x4E00;&#x4E2A;<code>RDD</code>&#xFF0C;&#x8FDB;&#x884C;<code>map</code>&#x6620;&#x5C04;&#x64CD;&#x4F5C;&#xFF0C;&#x6BCF;&#x6761;&#x6570;&#x636E;&#x7684;<code>key</code>&#x90FD;&#x6253;&#x4E0A;&#x4E00;&#x4E2A;&#x968F;&#x673A;&#x6570;&#x4F5C;&#x4E3A;&#x524D;&#x7F00;&#xFF08;1~N&#x7684;&#x968F;&#x673A;&#x6570;&#xFF09;&#xFF1B;&#xFF08;&#x7A00;&#x91CA;&#xFF09;</p>
<p><img src="http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/1560257361.png" alt=""></p>
<h3 id="&#x5C40;&#x9650;&#x6027;">&#x5C40;&#x9650;&#x6027;</h3>
<p>&#x5982;&#x679C;&#x4E24;&#x4E2A; RDD &#x90FD;&#x5F88;&#x5927;&#xFF0C;&#x90A3;&#x4E48;&#x5C06; RDD &#x8FDB;&#x884C; N&#x500D; &#x7684;&#x6269;&#x5BB9;&#x663E;&#x7136;&#x884C;&#x4E0D;&#x901A;&#xFF1B;
&#x4F7F;&#x7528;&#x6269;&#x5BB9;&#x7684;&#x65B9;&#x5F0F;&#x53EA;&#x80FD;&#x7F13;&#x89E3;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x4E0D;&#x80FD;&#x5F7B;&#x5E95;&#x89E3;&#x51B3;&#x6570;&#x636E;&#x503E;&#x659C;&#x95EE;&#x9898;&#x3002;</p>
<footer class="page-footer"><span class="copyright">Copyright &#xA9; &#x5C1A;&#x7845;&#x8C37;&#x5927;&#x6570;&#x636E; 2019 all right reserved&#xFF0C;powered by Gitbook</span><span class="footer-modification"><br>&#x8BE5;&#x6587;&#x4EF6;&#x6700;&#x540E;&#x4FEE;&#x8BA2;&#x65F6;&#x95F4;&#xFF1A;
2019-06-11 20:49:33
</span></footer>
                                
                                </section>
                            
    </div>
    <div class="search-results">
        <div class="has-results">
            
            <h1 class="search-results-title"><span class='search-results-count'></span> results matching "<span class='search-query'></span>"</h1>
            <ul class="search-results-list"></ul>
            
        </div>
        <div class="no-results">
            
            <h1 class="search-results-title">No results matching "<span class='search-query'></span>"</h1>
            
        </div>
    </div>
</div>

                        </div>
                    </div>
                
            </div>

            
                
                <a href="di-7-zhang-spark-xing-neng-you-hua/74-jvm-diao-you.html" class="navigation navigation-prev " aria-label="Previous page: 7.4 JVM 调优">
                    <i class="fa fa-angle-left"></i>
                </a>
                
                
                <a href="di-9-zhang-spark-troubleshooting.html" class="navigation navigation-next " aria-label="Next page: 第 9 章 Spark Troubleshooting">
                    <i class="fa fa-angle-right"></i>
                </a>
                
            
        
    </div>

    <script>
        var gitbook = gitbook || [];
        gitbook.push(function() {
            gitbook.page.hasChanged({"page":{"title":"第 8 章 Spark 数据倾斜解决方案","level":"2.2","depth":1,"next":{"title":"第 9 章 Spark Troubleshooting","level":"2.3","depth":1,"path":"di-2-bu-52063a-spark-xing-neng-you-hua-he-gu-zhang-chu-li/di-9-zhang-spark-troubleshooting.md","ref":"di-2-bu-52063a-spark-xing-neng-you-hua-he-gu-zhang-chu-li/di-9-zhang-spark-troubleshooting.md","articles":[]},"previous":{"title":"7.4 JVM 调优","level":"2.1.4","depth":2,"path":"di-2-bu-52063a-spark-xing-neng-you-hua-he-gu-zhang-chu-li/di-7-zhang-spark-xing-neng-you-hua/74-jvm-diao-you.md","ref":"di-2-bu-52063a-spark-xing-neng-you-hua-he-gu-zhang-chu-li/di-7-zhang-spark-xing-neng-you-hua/74-jvm-diao-you.md","articles":[]},"dir":"ltr"},"config":{"plugins":["splitter","expandable-chapters-small","page-toc-button","-highlight","prism","prism-themes","tbfed-pagefooter","sitemap","change_girls","livereload"],"styles":{"website":"styles/website.css","ebook":"styles/ebook.css","pdf":"styles/pdf.css","mobi":"styles/mobi.css","epub":"styles/epub.css"},"pluginsConfig":{"tbfed-pagefooter":{"copyright":"Copyright &copy 尚硅谷大数据 2019","modify_label":"<br>该文件最后修订时间：","modify_format":"YYYY-MM-DD HH:mm:ss"},"prism":{"css":["prismjs/themes/prism-solarizedlight.css"]},"disqus":{"shortName":"zhenchao125"},"livereload":{},"splitter":{},"change_girls":{"time":30,"urls":["http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/62171757.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/83394736.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/15906185.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/15906185.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/3394270.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/65028582.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/20359261.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/37472401.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/3355397.jpg-atguiguImg","http://lizhenchao.oss-cn-shenzhen.aliyuncs.com/imgs/18-3-4/11075549.jpg-atguiguImg"]},"search":{},"lunr":{"maxIndexSize":1000000,"ignoreSpecialCharacters":false},"fontsettings":{"theme":"white","family":"sans","size":2},"sitemap":{"hostname":"http://bigdataatguigu.applinzi.com/"},"page-toc-button":{"maxTocDepth":3,"minTocSize":2},"prism-themes":{},"expandable-chapters-small":{},"sharing":{"facebook":true,"twitter":true,"google":false,"weibo":false,"instapaper":false,"vk":false,"all":["facebook","google","twitter","weibo","instapaper"]},"theme-default":{"styles":{"website":"styles/website.css","pdf":"styles/pdf.css","epub":"styles/epub.css","mobi":"styles/mobi.css","ebook":"styles/ebook.css","print":"styles/print.css"},"showLevel":false}},"theme":"default","author":" 李振超","pdf":{"pageNumbers":true,"fontSize":12,"fontFamily":"Arial","paperSize":"a4","chapterMark":"pagebreak","pageBreaksBefore":"/","margin":{"right":62,"left":62,"top":56,"bottom":56}},"structure":{"langs":"LANGS.md","readme":"README.md","glossary":"GLOSSARY.md","summary":"SUMMARY.md"},"variables":{},"title":"大数据 bigdata_spark_kernel-optimize_atguigu 课堂笔记","language":"zh-hans","links":{"sidebar":{"联系我们":"http://www.atguigu.com/"}},"gitbook":"*","description":"课堂笔记,学生提前预习"},"file":{"path":"di-2-bu-52063a-spark-xing-neng-you-hua-he-gu-zhang-chu-li/di-8-zhang-spark-shu-ju-qing-xie.md","mtime":"2019-06-11T12:49:33.925Z","type":"markdown"},"gitbook":{"version":"3.2.3","time":"2019-07-15T00:07:35.887Z"},"basePath":"..","book":{"language":""}});
        });
    </script>
</div>

        
    <script src="../gitbook/gitbook.js"></script>
    <script src="../gitbook/theme.js"></script>
    
        
        <script src="../gitbook/gitbook-plugin-splitter/splitter.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-expandable-chapters-small/expandable-chapters-small.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-page-toc-button/plugin.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-change_girls/girls.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-livereload/plugin.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-search/search-engine.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-search/search.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-lunr/lunr.min.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-lunr/search-lunr.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-sharing/buttons.js"></script>
        
    
        
        <script src="../gitbook/gitbook-plugin-fontsettings/fontsettings.js"></script>
        
    

    </body>
</html>

